智能论文笔记

Pixels2Pose: Super-Resolution Time-of-Flight Imaging for 3D Pose Estimation

Alice Ruget , Max Tyler , Germán Mora Martín , Stirling Scholes , Feng Zhu , Istvan Gyongy , Brent Hearn , Steve McLaughlin , Abderrahim Halimi , Jonathan Leach

分类：计算机视觉

2021-10-11

单光子敏感的深度传感器正在越来越多地用于人类姿势和手势识别的下一代电子。但是，具有成本效益的传感器通常具有低空间分辨率，从而将其用于基本运动识别和简单的对象检测。在这里，我们执行一个时间到空间映射，从而大大增加了简单飞行时间传感器的分辨率，即〜初始分辨率为4 $ \ times $ 4像素到分辨率32 $ \ times $ 32像素的深度图像。然后，可以将输出深度图用于准确的三维人姿势估计多人。我们开发了一个新的可解释框架，该框架为我们的网络如何利用其输入数据提供了直觉，并提供了有关相关参数的关键信息。我们的工作大大扩展了简单的飞机飞行时间传感器的用例，并为将来应用于具有相似数据类型的其他类型的传感器（即雷达和声纳）开辟了有希望的可能性。

translated by 谷歌翻译

FETA: Towards Specializing Foundation Models for Expert Task Applications

Amit Alfassy , Assaf Arbelle , Oshri Halimi , Sivan Harary , Roei Herzig , Eli Schwartz , Rameswar Panda , Michele Dolfi , Christoph Auer , Kate Saenko

分类：计算机视觉

2022-09-08

基础模型（FMS）已证明了前所未有的功能，包括零拍学习，高保真数据合成和范围内的概括。但是，正如我们在本文中所显示的那样，FMS在专家任务上的开箱即用表现较差（例如，从语言查询中检索汽车手册技术插图），数据是看不见的，或者属于长尾的数据用于FM预训练的大型数据集的数据分布的一部分。这强调了在此类专家任务上明确评估和芬太尼FMS的必要性，这可以说是在实际现实世界中最重要的任务。在本文中，我们提出了围绕教授FMS了解技术文档的任务，通过学习将其图形插图与相应的语言描述相匹配的任务围绕着了解技术文档的任务。我们的FETA基准重点是公共汽车手册和销售目录手册中的文本对图像和图像到文本检索。 FETA配备了完全自动注释提取的程序（接受后将发布代码），从而使Feta轻松扩展到将来更多的文档类型和应用域。我们的自动注释导致自动性能指标显示，该指标与在人类策划注释中计算的指标一致（也发布）。我们提供多个基线和对FETA的流行FM的分析，从而导致一些有趣的发现，我们认为这对FM社区非常有价值，为现实世界中FMS应用于当前被标准基准的“忽视”的实践专家任务铺平了道路。在常见对象上。

translated by 谷歌翻译

Federated Unlearning: How to Efficiently Erase a Client in FL?

Anisa Halimi , Swanand Kadhe , Ambrish Rawat , Nathalie Baracaldo

分类：机器学习

2022-07-12

由于隐私立法赋予用户有权被遗忘的权利，因此使模型忘记其某些培训数据已经成为必不可少的。我们探讨了删除任何客户在联邦学习（FL）中的贡献的问题。在FL回合中，每个客户都进行本地培训，以学习一个模型，以最大程度地减少其私人数据的经验损失。我们建议通过逆转学习过程，即训练模型\ emph {最大化}局部经验损失来对客户（将要删除）进行学习。 In particular, we formulate the unlearning problem as a constrained maximization problem by restricting to an $\ell_2$-norm ball around a suitably chosen reference model to help retain some knowledge learnt from the other clients' data.这使客户可以使用投影的梯度下降来执行学习。该方法确实不需要全局访问用于培训的数据，也不需要由聚合器（服务器）或任何客户端存储的参数更新历史记录。 MNIST数据集的实验表明，所提出的未学习方法是有效的。

translated by 谷歌翻译

Garment Avatars: Realistic Cloth Driving using Pattern Registration

Oshri Halimi , Fabian Prada , Tuur Stuyck , Donglai Xiang , Timur Bagautdinov , He Wen , Ron Kimmel , Takaaki Shiratori , Chenglei Wu , Yaser Sheikh

分类：计算机视觉

2022-06-07

虚拟网格是在线通信的未来。服装是一个人身份和自我表达的重要组成部分。然而，目前，在培训逼真的布置动画的远程介绍模型的必需分子和准确性中，目前无法使用注册衣服的地面真相数据。在这里，我们提出了一条端到端的管道，用于建造可驱动的服装代表。我们方法的核心是一种多视图图案的布跟踪算法，能够以高精度捕获变形。我们进一步依靠跟踪方法生产的高质量数据来构建服装头像：一件衣服的表达和完全驱动的几何模型。可以使用一组稀疏的视图来对所得模型进行动画，并产生高度逼真的重建，这些重建忠于驾驶信号。我们证明了管道对现实的虚拟电视应用程序的功效，在该应用程序中，从两种视图中重建了衣服，并且用户可以根据自己的意愿进行选择和交换服装设计。此外，当仅通过身体姿势驱动时，我们表现出一个具有挑战性的场景，我们可驾驶的服装Avatar能够生产出比最先进的面包质量明显更高的逼真的布几何形状。

translated by 谷歌翻译

A Novel Occupancy Mapping Framework for Risk-Aware Path Planning in Unstructured Environments

Johann Laconte , Abderrahim Kasmi , François Pomerleau , Roland Chapuis , Laurent Malaterre , Christophe Debain , Romuald Aufrère

分类：机器人

2020-11-16

在自治机器人的背景下，最重要的任务之一是在导航期间防止对机器人的潜在损坏。为此目的，通常认为必须处理已知的概率障碍，然后计算与每个障碍物碰撞的概率。然而，在复杂的场景或非结构化环境中，可能难以检测这种障碍。在这些情况下，使用公制地图，其中每个位置存储占用的信息。最常见的公制地图类型是贝叶斯占用地图。然而，由于其离散性，这种类型的地图对计算持续路径的风险评估不太适合。因此，我们介绍了一种名为Lambda领域的新型地图，专门用于风险评估。我们首先提出了一种方法来计算这样的地图和对路径的通用风险的期望。然后，我们用一个用例展示了我们的通用配方的益处，该用例将风险定义为路径上的预期碰撞力。使用这种风险定义和Lambda领域，我们表明我们的框架能够在具有物理度量的同时进行经典路径规划。此外，Lambda领域为处理非结构化环境（如高草）提供了一种自然的方式。如果标准环境表示始终会产生围绕此类障碍的轨迹，我们的框架允许机器人在意识到所采取的风险时穿过草地。

translated by 谷歌翻译